查看原文
其他

“AI复活”,安慰还是生意?

定焦团队 定焦 2024-03-24

有人靠技术,有人靠套路。


定焦(dingjiaoone)原创

作者 | 苏琦

编辑 | 金玙璠




“起死回生”这件事,过去只在科幻电影里见过,但今年,被“复活”的案例越来越多。

2月底,知名音乐人包晓柏用AI“复活”女儿,女儿在妈妈生日时还为她唱了一首生日歌;3月初,商汤年会上,刚去世不久的商汤科技创始人汤晓鸥以数字人的形式被“复活”,还来了一场“汤式风格”的演讲;近日,还有有网友用AI技术“复活”李玟、乔任梁等已逝明星,备受争议。

和逝去的亲人“再见面”,这门此前隐秘小众的生意,开始频繁地出现在大众眼前。但因为用到的技术不同,价格不同,效果也不同。

花10元,能让去世亲人的照片“眨眼”,背后是简单的图像处理技术;花千元,能和没来及道别就离开的亲人视频通话,用到的是AI换脸变声技术;花万元,则可以和电子屏幕里亲人的克隆数字人聊天,数字人能说会动有表情,真实感更强。

“AI复活”是一门有强烈需求的生意,酝酿着亿级市场,盯上这块蛋糕的商家却鱼龙混杂。有的下载软件就能制作“会说话的照片”进行售卖;有的本身是数字人服务商,在向B端售卖直播、会展、主持人等数字人之外,开发面向C端的数字人定制APP;还有一批商家,看准了用户复活亲人、克隆明星的需求,用自研+接入第三方技术接口的方式,为用户提供定制化服务。

“AI复活”或许在将来会成为一个像拍照一样常见的服务,但其中也存在数据隐私、法律伦理等问题。有业内人士表示,AI换脸变声技术的成熟,还会让一些人借着用户对亲人的想念和信任实施诈骗,“回忆虽好,谨防被‘割’”,他提醒道。



“复活”亲人,需要多少钱?

目前市面上的“AI复活”产品,根据成本高低、技术难易,可以分为三个等级,也对应着用户在AI“复活”某人之后,与亲人“再次相见”的三种方式。

其中最低一档是照片驱动,俗称talking photo(能动的照片),前几年就有类似的APP火过一阵。

利用深度学习、图像处理等技术,就能让照片里人物的嘴巴和眼睛动起来;如果让照片里的人开口说话或唱歌,则要用到对口型(唇语匹配)和语音生成。“这些技术都已经成熟且开源,量产之后,单次成本可以压缩到10元以内。”有10年AI创业经验的极链科技创始人&总裁董慧智介绍。

第二档是表情捕捉驱动的伪直播,给真人模特换上逝者的形象和声音,进行语音电话或视频电话等互动,或生成祝福短视频等。

这里面用到了语音克隆、AI换脸、动捕(表情捕捉)、深度伪造(deepfake)等技术来变人变声。董慧智称,这是一种特别讨巧的方式,技术不新鲜,部分AI诈骗用到的是类似的技术。动捕器材及人力成本稍高一些,需要数千元。

这类“AI复活”的视频片段在短视频平台播放量很高,一般是小辈为家里的老人下订单,找人用逝者的脸和声音与老人通话,对老人谎称逝者在外工作,将“善意的谎言”继续,老人一般也看不出异样,只是频频抹泪。


孙先生用AI换脸“复活”父亲

第三档是近期比较火的用数字人技术“复活”亲人,因为交付的产品不一样,成本也有所不同。

一般来说,通过收集人物生前的照片、声音等数据来克隆数字人的形象和声音,然后底层搭载大语言模型模拟逝者的思想,可与之进行实时的文字或语音交流。

51数字人有这项业务,创始人陈鸿告诉「定焦」,一般产品交付的是一个带有数字人的屏幕,大屏有电视那么大,小屏可以是iPad那么大。用户登录账号之后,就能看到逝去亲人的数字人形象,用户可以通过语音或文字与数字人互动,产品还可以提供语音电话叫醒服务。

“定制类的‘复活亲人’业务,一般要5万元以上。”陈鸿称,因为客户都是长期付费,后续还会不断在细节上调优,也有一些客户是一个家族凑钱一起做,要求更高。

“AI复活”对于数据质量的要求非常高,被克隆者生前的照片、视频或语音样本越多、越清晰,数字人的相似度就越高。再输入一些个人特征数据,比兴趣爱好,才能模拟其性格。“素材不够全,成本还会再增加。”陈鸿表示。

因此,精度越高、数据越定制化,效果也就越接近真人,价格也更贵。所谓的精度,主要体现在以下几个方面:人物口型准确度、分辨率清晰度、动作复杂程度、服饰发型和表情丰富度、语音(音色、语气)相似度、是否有电音、是否有抑扬顿挫(多情感)、是否带交互、交互是否更贴合本人性格等。

放到数字人领域,需要完美克隆某个人的技术难度可谓“上不封顶”。商汤科技“复活”的创始人汤晓鸥,就是一个案例。


“数字人”汤晓鸥在年会上的演讲  图源 / 视频截图

商汤科技数字空间事业群数字文娱事业部总经理栾青告诉「定焦」,为了还原汤老师的音容笑貌,用到了不同技术。整个制作过程中,商汤运用了自研的TTS语音生成大模型,截取了汤老师四、五段不同说话风格的声音作为prompt(提示),总声音素材不过十几秒,还原了汤老师的东北口音、音色、常用的语气词和语调以及冷幽默的风格。

此外,商汤如影数字人技术团队采用了汤老师之前清晰有效的视频,用商汤自研的视频生成技术进行动作生成和场景过渡,还原走动、喝水等动作,以及微笑的表情。

受限于素材不多,以及算力、成本的考量,目前很多数字人的视频和产品看起来还是很“假”。“这些都不算是完整地‘复活’数字人,技术和服务的最高交付上限,也无法满足人们的最低需求下限”,陈鸿称。

形象不够像,就得用情绪价值来补,在数字人的设计上加入一些交互细节。他举例,比如一个客户的爷爷最喜欢老四,聊天时爷爷突然会说下个月是老四的生日了,家人要多聚、兄弟要和睦,客户就会一下子被打动。

总得来说,前两档用到的都是相对简单的图像处理、换脸和声音克隆技术,能看到人脸、模仿声音,但因为成本低,效果粗糙,市面上看到的还原度比较高且能动起来、能对话的都属于第三档数字人,越像越贵。



谁在靠克隆人赚钱?

从过往“复活亲人”的案例可以看到,大部分不像真人且让人出戏甚至尴尬。而随着生成式AI技术的发展,栾青观察到,“AI复活”在技术上的可行性和真实度上都变得更高,能让人投入、想哭,使得这类需求被进一步激发出来。

由此,一条产业链应运而生。在这条产业链上,一部分是跟风商家,一部分是数字人服务商,一部分是AI从业者,还有一部分是专门做定制AI复活(复活或克隆亲人、明星、企业家等)的玩家。

电商平台上,有不少店铺提供“AI复活”服务,让照片说话的标价多为10元、50元。短视频平台上,也有不少人以“AI造梦”“AI疗愈”的名义提供类似服务。“收费便宜、效果粗糙,但这是一个长期存在的长尾市场。”董慧智称。


淘宝上售卖的“让照片说话”服务

这类生意也存在灰色空间,有短视频博主发布“复活”李玟、张国荣、乔任梁等已逝名人的视频,让他们开口唱歌和说话,虽然称“旨在致敬和纪念,无商业目的”,但此类视频获得的流量颇高,还有部分会借此引流做“亲人复活”生意。同时,一些提供“AI复活”服务的店铺也注明“只做怀念,人脸识别请绕道”。

目前,技术成熟的数字人服务商和AI从业者,更多是将商业模式放在B端,比如AI客服、数字人直播、AI老师、A主持人、AI医疗等,有部分推出了面向C端的类似工具,但并未大规模宣传。

有网友曾用大模型初创公司MiniMax的语音大模型,将一段90秒的音频素材进行语音克隆,并用MiniMax旗下的海螺问问APP生成智能体,与之进行语音对话。硅基智能也有“生命克隆和数字永生”业务,其旗下的炎帝大模型基于用户提供的数据克隆出数字人,用户则可以通过DUIX APP与数字人实时交互。


硅基智能DUIX APP定制数字生命

陈鸿和团队主要做的是高精度定制市场,平均一单5万元起,围绕大客户开发场景,比如数字墓地,去墓地缅怀先人时,先人从电子屏里走出来跟大家聊天;比如纪念馆智能工程,包括建筑空间搭建等;比如名人“复活”,用初期古画“复活”了朱熹等。


51数字人制作的朱熹

“提供定制服务的公司,不仅考验底层技术能力,更考验的是渠道深度以及服务的落地程度,这决定了能否让用户真正把数字人用起来。”陈鸿认为。

从技术提供方的角度来看,栾青认为,商汤如影的定位就是通过数字人技术赋能各个行业,谁更了解行业,谁更能下场服务好用户,谁有更深度的解决方案,谁就能吃到更多蛋糕,“复活亲人不是一个纯粹从技术角度就可以做的生意。”

“AI复活这门生意更适合中型团队去做”,董慧智分析,大公司的运营和研发成本很高,同样一套技术,他们会优先去做标准化、批量化、适用更多场景的B端生意。陈鸿也表示,大厂不愿意做,小团队没有实力做,这个市场年收入500万到1亿,是中型团队的机会”。

目前看来,“AI复活”看似门槛不高,但真正做好还要面对很多难题。

当前,“AI复活”还存在技术受限、素材储备缺乏、家中有人反对等局限,普及仍有难度。

大部分数字人需要攻克的技术难点是,能否做到人机难辨。栾青提到,数字人在说话、动作、场景衔接等方面已经向前进了一步,但在较长时间的交互过程当中,仍然未能达到真正的人机难辨,在情感传达、理解力、意识等方面还有待完善。

而真的想让一个人“复活”,细节体现在方方面面。陈鸿以一个交互场景举例说,在与数字人爷爷对话时,如果用户问到了数字人数据库里没有的信息,比如“谁是尼采”,数字人就会跳转到大模型,根据公开的答案回答,虽然可以持续进行多轮对话,但就会很假,用户的沉浸感就会被打断。



“AI复活”,仍需敬畏

“AI复活”的需求旺盛,但不是所有人都持支持态度,背后隐藏的隐私安全和伦理问题也不可忽视。 

支持派认可的是其提供的情绪价值,认为“复活”亲人,是对生者的慰藉和对遗憾的满足,是技术向善的例子。

质疑派则认为人永远不可能“复活”,也无法进行“授权”。即便“AI复活”得到了亲属的授权和认可,但逝者本人的意愿无从得知。

“数字永生没有那么容易,即使使用大模型,最终复刻出来的只是一个长着相同面孔的GPT,当他以相似的记忆和远胜于本人能力和智商跟你对话时,你的感受一定会好吗?”董慧智反问。

3月16日,针对儿子肖像被短视频创作者侵权使用一事,乔任梁父亲表示不能接受,感到不舒适,希望对方尽快下架,“他们未征求我们同意,是我侄女刷到视频发给我的,这是在揭伤疤。”

如果克隆数字人出现问题,对生者可能将带来二次伤害。太多影视剧作品探讨过其中的伦理困境和人性幽微。

2013年播出的《黑镜》,其中一集讲的便是女主“复活”了在车祸中去世的丈夫,虽然复制了丈夫的记忆和躯体,却无法复制情感和选择,这位AI丈夫无需睡觉、不会受伤,只会呆板地按照命令行事。女主意识到“你不是你,你只是涟漪”,最终将机器人锁在阁楼上,却怨恨自己离不开这虚假的真实。


《黑镜》截图  图源 / 豆瓣用户Hiro

随着“AI复活”产业链的成熟,“复活亲人”“克隆明星”的需求和案例增多,其中涉及的隐私数据泄露、AI诈骗等诸多法律风险,也受到关注。

现实生活中,通过AI换脸实施诈骗的案例时有发生。今年315晚会就曝光了多起利用AI技术换脸变声成亲人,实施诈骗的案例。此外,假冒名人也是骗局中的重灾区。今年3月,刘德华经纪公司映艺娱乐通过微博发布声明,称刘德华声音被克隆伪造,提醒各方人士警惕骗局。

复刻亲人时,为了更高的还原度,用户只能对技术提供方保有更大的开放度,这就决定了用户很难保护自己,一旦遇到骗子,很难界定到底是服务还是诈骗。

对此,陈鸿建议,想要“AI复活亲人”的用户,在下单前应该签署合同,规定数字人的各项权利属于个人,以及提供的个人信息不被泄露。

“AI的发展是超速的,而安全问题不管是从法律层面、文化层面、公民意识层面还是技术层面的,都处于滞后状态。”董慧智称,最终产业的发展还是要靠从业者自律和监管条例的规范。

栾青称,行业的规范和安全是业务发展的大前提。在中国信通院牵头下,商汤联合多家AI公司共同制定了“可信数字人”的标准。

不可怀疑的是,人和AI的关系会在今后变得更加紧密和多元,“AI复活”这件事,以后有可能会成为一个标准服务,就跟打印一张照片一样简单。

随着技术进步,“AI复活”的概念还在继续升级,比起一段视频、一个聊天机器人产品,有人提出了数字永生、数字陪伴、随身亲人等概念,“有富翁在自己还活着的时候,就开始着手复制自己,搭建自己的这种数字永生库”,董慧智称。

2015年,俄罗斯亿万富翁德米特里·伊茨科夫发出倡议,宣称到2045年将为所有人打造一副机器人身体来实现永生,这项计划面临一定争议。2022年,伊隆·马斯克在推特上提到已经将自己的大脑上传到云端,并与自己的虚拟版本交谈过,但有人认为这是马斯克在宣传自己的脑机接口公司Neuralink。

随着“AI复活”褪去神秘感,行业或许也会开始进入价格内卷的时代,如果不想出现“劣币驱逐良币”的情况,行业还需保持敬畏之心。


*题图来源于Unsplash。

2024年,文娱“搞钱”六大方向

婚托、PUA、相亲贷,婚恋平台有多狂

AI手机,只是噱头?

关注并【星标⭐】「定焦」
    第一时间收到精彩内容更新
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存